مطالعه ای بر برآوردیابی استوار در مدل های رگرسیونی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان فارس - دانشکده علوم پایه
  • نویسنده مریم افتخاری
  • استاد راهنما نرگس عباسی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1392
چکیده

رگرسیون استوار یکی از مهمترین روش های آنالیز داده هایی می باشد که آلوده هستند و نقاط پرت دارند.این روش می تواند جهت تعیین نقاط پرت استفاده شود و نتایج پایداری را در حضور داده های پرت فراهم آورد.در این پایان نامه روش رگرسیون استوارمعرفی و در نرم افزارsas/stat- version 9اجرا شده است.در ادامه روش استوار در آزمون مدل های جزئی خطی تعمیم یافته بررسی می شود به این صورت که یک خانواده از آماره های استوار معرفی می شود که امکان انتخاب بین یک مدل پارامتری و نیمه پارامتری را فراهم می آورد. مدل های نیمه پارامتری شامل هر دو حالت مدل هایی با مولفه های پارامتری و نیمه پارامتری است. گاهی اوقات مولفه ی ناپارامتری نقش یک پارامتر مزاحم را بازی می کند. بسیاری از تحقیقات انجام شده با یک چهارچوب مشترک کلی، بر روی مولفه های پارامتری برای رسیدن به یک آماره ی به طور مجانبی کارا، دنبال می شود. هدف آن است که توجه به نسخه های نیمه پارامتری از مدل خطی تعمیم یافته به ازایt?t?r وx ?r^p، متغیرهای کمکی (x ,t) ، متغیر پاسخ y را بر روی یک مجموعه ی فشرده t، پیش بینی کنیم. بدون از بین رفتن کلیت مسئله، فرض می کنیمt=[0 ,1]. همچنین توزیع شرطیy|(x,t)متعلق به خانواده ی نمایی exp[y? (x,t ) - b (? (x,t )) + c (y)] می باشد و برای? و c ? (x,t )= e (y?(x,t ) )= b^ (? (x,t ) ) وb^ مشتق b می باشد.در مدل های خطی تعمیم یافته مک کلا و نلدر (1989) یک تکنیک عمومی برایمدل بندی داده هایی که تنوع وسیعی دارند به این صورتاست که اغلب فرض می شود که میانگیناز طریق یک تابع پیوندی gکهg(? (x,t) )= ? +x_t ? + ?tمحاسبه می شود.برای نمونه یک مدل عادی از رگرسیون لجستیک از مشاهدات(y_i ,x_i ,t_i)به طوری که متغیر های پاسخ، متغیرهای مستقل و دوجمله ای y_i |(x_i ,t_i ) ? b_i (1,p_i ) باشند، احتمال موفقیت ها به متغیر تبیینی زیر بستگی دارد: g(p_i )= ? +x_i^t ? + ?t_i, که در آن g (u)= log (u/(1 - u)) است. در بسیاری موقعیت ها مدل خطی برای بیان رابطه ی بین متغیر پاسخ و متغیر کمکی متناظر نارسا است. یک استراتژی مقابل این است که در مدلی که یک و یا تعدادی کمی از پیش بینی کننده ها ناپارامتری باشند به پیش بینی کننده ها اجازه بدهیم که به صورت خطی در مدل آشکار شوند.در این استراتژی تحت مدل جزئی خطی تعمیم یافته نیمه پارامتری رابطه زیر برقرار است ?(x,t)= h(?(t )+ x^t ?) که درآنh=? g?^(-1) یک تابع پیوندی شناخته شده و ??r^pیک پارامتر ناشناخته و ?یک تابع هموار ناشناخته می باشد. آزمون های استوار برای فرض مقابل،تحت مدل رگرسیون جزئی خطی توسط بیانکوو همکاران (2006) مورد مطالعه قرار گرفت. در کنار این رویکرد های استوار برای آزمون پارامتری از یک تابع رگرسیون،ونگ و کو (2007) یک چاره ی کلی مبنی بر اساس تبدیل رتبه ی مجانبی متمرکز شده زمانی کهh(t )=t و ?=0 به این معنی که تحت مدل ناپارامتریy_i= ?(t_i ) + ?_iباشد را مورد ملاحظه قرار دادند.بونته و همکاران (2006) تحت مدل جزئی خطی تعمیم یافته یک مشخصات کلی مبنی بر فرآیند استوار دو گامی جهت برآورد کردن پارامتر ?و تابع ?رامعرفی کردند،همچنین رودریگز و بونته(2010)(همچنین رودریگز(2008)) جهت بهبود زمان محاسباتی روش را به سه گامی توسعه دادند. فراتر از اهمیت برآوردگرهای استوار در بیشتر مجموعه های کلی و بزرگ کاربر روی آزمون ها نیز سزاوار توجه است.یک بازبینی بروز شده از نتایج آزمون های فرض استوار توسط هی (2002) انجام گرفته است. هدف پیشنهاد دادن یک کلاس از آزمون ها برای مولفه ی ناپارامتری بر پایه روش استوار سه گامی ارائه شده توسط رودریگز و بونته(2010) می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

برازش استوار مدل های رگرسیونی آمیخته

در سال های اخیر کاربردهای چشمگیر توزیع های آمیخته متناهی و مدل های مربوط به آن در علوم آماری و دیگرعلوم از جمله اقتصاد، ژنتیک، کشاورزی و $cdots$ به وفور دیده شده است. در این میان روش های برآورد پارامترهای این توزیع مورد توجه بسیاری از آماردانان قرار گرفته است. پارامترهای آمیخته ای از مدل های رگرسیونی خطی با روش حداکثر درستنمایی و با استفاده از الگوریتم $em$، بر اساس فرضیه نرمال برای جملات خطا ...

مطالعه ای بر مدل های رگرسیونی اسپلاین

تحلیل رگرسیون یکی از شاخه های مهم علم آمار است که هدف آن بررسی اثر متغیرهای مستقل (پیش بین) روی متغیر وابسته (پاسخ) است. رگرسیون اسپلاین یک چندجمله ای گام به گام است که شامل یک چندجمله ای با درجه پایین در داخل هر یک از همسایگی دو گروه?_r,?_(r+1) است که در گره ها به طور مناسب به هم متصل می گردند اما در محل گره ها دارای مشتق ناپیوسته هستند. بهترین عملکرد هموارساز رگرسیون اسپلاین بستگی به مکان های...

یک برآوردگر بسیار استوار برای مدل های رگرسیونی

استخراج الگوها و مدل های مطلوب از مجموعه داده های بزرگ توجه بسیاری را در رشته های مختلف بخود جلب کرده است، در این خصوص استخراج اطلاعات مفید از پایگاه های داده و داده کاوی دو زمینه جالب توجه برای محققین در شناسایی الگوها، آمار، هوش مصنوعی و خصوصاً محاسبات در سطوح بالا ایجاد کرده است.در این پایان نامه یک روش کارا و استوار به نام تجزیه کلاس رگرسیونی آمیخته برای استخراج کلاس های رگرسیونی در مجموعه د...

15 صفحه اول

روشهای رگرسیونی استوار با نرم l1

در این پایان نامه روشهای مختلف رگرسیونی برای انتخاب متغیرهای توصیفی مهم و برآورد پارامترها مطرح می شود و مزایا و معایب هریک مورد بررسی قرار می گیرد.به طور ویژه روشهای رگرسیونی تاوانیده با تاوان l1 از دیدگاه آمار کلاسیک و آمار بیزی موردمطالعه و بررسی قرار می گیرند .روش رگرسیونی چندکی لاسوی انطباقی برای برآورد دقیق ضرایب رگرسیونی وانتخاب متغیرهای توصیفی مهم از دیدگاه آمار بیزی معرفی می شود. با اس...

چندروش برآوردیابی استواردر مدلهای رگرسیونی چندکی با دادههای پرت

در آمار و روش های آماری در اقتصاد، اغلب با مجموعه داده هایی روبرو هستیم که شامل نقاط پرت هستند. رگرسیون چندکی خطی نیز به عنوان روشی پرکاربرد در آمار، نسبت به مشاهدات پرت، مخصوصا مشاهدات پرت موجود در متغیرهای مستقل، حساس است. در این پایان نامه ابتدا چند برآوردگر رگرسیونی را معرفی کرده و نشان می دهیم که چگونه می توان با استفاده از نقطه شکستگی استواری آنها را ارزیابی کرد. سپس درباره ی برآوردگرهای ...

15 صفحه اول

برآوردهای استوار برای مدل های رگرسیونی کمترین توان های دوم جزیی

روشهای رگرسیون کمترین توانهای دوم جزیی (pls) برای الگوسازی و برآورد پارامترهای مدل های رگرسیونی در صورت وجود هم خطی چندگانه و هنگامی که تعداد متغیرهای توضیحی بیشتر از تعداد کل مشاهدات باشد، به کار گرفته می شوند. روش pls اولین بار توسط اسوانت ولد و هارلد مارتنز (1983) در زمینه طیف سنجی ارائه شده و دی جونگ (1993) الگوریتم simpls را در مواقعی که بیش از یک متغیر پاسخ برای الگوی رگرسیونی مطرح باشد، ...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان فارس - دانشکده علوم پایه

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023